2018年赛题解析

数据

数据清洗

了解基本信息(数据残缺情况,数据量,数据类型,列名)

某些列有很多残缺值,需要我们进行处理

对数据类型有问题的列进行审查

填充数据(用平均值进行填充

筛选有用的列

模型-熵权法

熵函数

$$f(x)=-p\ln p$$

例子:比较[0.5,0.5]和[0.2,0.8]谁的熵更大

后者提供的信息更大

第一步: 将数据转换为比值

第二步:求每一列数据的熵

第三步:求权重

层次分析法(AHP)

第一步:构建层级

(此处应有一张层次图) image

第二步:构建两两对比矩阵

第三步:求权重

$$AX =\lambda X$$

称$\lambda$是$X$的特征值,$X$是特征向量

作业

  1. 复习课堂代码,回顾课堂知识点
  2. 将熵权法和AHP方法用于电脑选择问题,将熵权法和AHP方法的过程和结果补充到论文中(发pdf给我)
  3. 使用某种数据补全的方式将 'Drop (feet)','Duration (min:sec)', 'G Force', 'Vertical Angle (degrees)'数据进行补全

将pdf和第三题的代码文件发送到 learningmm@163.com(下周四晚之前)